Amazon представила мощные ускорители Trainium2 для обучения больших ИИ-моделей, а также Arm-процессоры Graviton4
Облачные гиганты вступают в новую гонку вооружений, где главным оружием становятся не программные алгоритмы, а собственные кремниевые решения. Amazon, стремясь обойти дефицит чипов и снизить зависимость от сторонних поставщиков, представила на ежегодной конференции re:Invent сразу два чипа нового поколения. Ускоритель Trainium2, предназначенный для обучения нейросетей, и серверный процессор Graviton4 — это не просто плановая итерация, а прямая заявка на лидерство в гонке за производительность и энергоэффективность. В то время как рынок задыхается от нехватки GPU, Amazon делает ставку на вертикальную интеграцию, обещая клиентам качественный скачок в скорости и стоимости обучения больших языковых моделей (LLM).
Trainium2: четырехкратный рывок в производительности ИИ
Новый ускоритель AWS Trainium2 демонстрирует впечатляющую эволюцию: по сравнению с первым поколением, выпущенным в декабре 2020 года, производительность выросла в четыре раза, а энергоэффективность — вдвое. Amazon уже предлагает своим клиентам доступ к этим чипам через инстансы EC Trn2. Базовое решение представляет собой кластер из 16 чипов, однако для по-настоящему масштабных задач предусмотрена опция AWS EC2 UltraCluster, объединяющая до 100 000 ускорителей Trainium2. Такая конфигурация способна, по заявлению производителя, обучить LLM с 300 миллиардами параметров всего за несколько недель — задача, на которую ранее уходили месяцы.
Для понимания масштаба: 300 миллиардов параметров — это почти вдвое больше, чем у знаменитой GPT-3 от OpenAI. Теоретическая вычислительная мощность кластера из 100 000 чипов оценивается в 65 Эфлопс, что в пересчете на каждое ядро дает около 650 Тфлопс. Хотя эти цифры являются идеализированными, даже при более скромной реальной производительности в 200 Тфлопс на ядро, Trainium2 способен превзойти показатели аналогичных решений от Google. Amazon не назвала точные сроки коммерческой доступности, ограничившись расплывчатым прогнозом — «где-то в следующем году».
Graviton4: эволюция серверных процессоров и новая эра безопасности
Второй анонс касался процессора Graviton4, построенного на архитектуре Arm. Amazon утверждает, что новинка на 30% производительнее, на 50% имеет больше ядер и на 75% быстрее работает с памятью, чем процессор предыдущего поколения Graviton3. В базовой конфигурации Graviton4 предлагает до 96 ядер и поддержку 12 каналов оперативной памяти DDR5-5600. Однако ключевым нововведением стало не только повышение производительности, но и усиление безопасности: все физические аппаратные интерфейсы нового чипа зашифрованы. Это решение, по замыслу разработчиков, должно обеспечить надежную защиту клиентских данных и рабочих нагрузок по обучению ИИ, особенно тех, что предъявляют повышенные требования к конфиденциальности.
«Graviton4 — это четвёртое поколение процессоров, которое мы выпустили всего за пять лет, и это самый мощный и энергоэффективный чип, когда-либо созданный нами», — заявил вице-президент AWS по вычислениям и сетям Дэвид Браун. Он подчеркнул, что компания целенаправленно «затачивает» чипы под реальные запросы клиентов, предлагая наиболее передовую облачную инфраструктуру. Процессоры Graviton4 уже доступны в массивах Amazon EC2 R8g в предварительной версии.
Представленные чипы — это не просто ответ на текущий дефицит GPU, который наблюдается во всем мире. Это стратегический шаг, направленный на переформатирование рынка облачных вычислений. Ранее Amazon уже представила первое поколение Trainium в 2020 году, а Graviton3 — в 2021-м. Нынешние анонсы показывают, что компания ускоряет темпы разработки собственного «железа», стремясь снизить зависимость от Nvidia и других поставщиков.
Успех этих чипов будет означать, что Amazon сможет предлагать своим клиентам уникальное ценовое предложение: обучение моделей ИИ не только быстрее, но и значительно дешевле, с меньшим энергопотреблением. Однако для рынка это сигнал о том, что будущее облачных технологий лежит в плоскости контроля над производством ключевых компонентов. Если Trainium2 и Graviton4 оправдают заявленные характеристики, конкуренты, такие как Google и Microsoft, будут вынуждены ускорить собственные программы разработки кремния, чтобы не потерять долю рынка. В конечном итоге, выиграют конечные пользователи, получая доступ к более мощным и доступным инструментам для работы с генеративным ИИ.















